Google Analytics の落とし穴

背景

Google Analytics (以下:GA)を使っていて、期間が定まっていても、集計された指標や数字が変動したり、データがなくなったりという事象が起こっています。
検証など行いましたが、やはり不明な部分が残っていたので、直接GAのサポートに問い合わせしました。

いただいている回答を社内で展開して、意外と知らない人が多くおり、社外にも展開しようと思っています。
下記のことはGAのサポートからいただいている回答を加味したものです。

GAの落とし穴

下記のこと、よく出たりします。

  1. レポートの指定期間を伸ばすと、データが出たり出てなかったりする
  2. GAの指標の個数によって、メジャーの数字が変わったりする
  3. 期間の長さによって、特定期間のメジャーの数字が変わったりする
  4. 新しく実装されたカスタムディメンションをレポートに含めると、データが出たり出てなかったりする

それでは、一つずつ解明していきましょう。

レポートの指定期間を伸ばすと、データが出たり出てなかったりする?

事象

例えば、GA Portalにて、あるユーザーの2019/10のデータを出しました。 ⬇︎

ただし、レポートの条件を全く変えず期間だけ伸ばすと(2019/08〜2019/10)、データが出ませんでした。「このレポートのデータはありません。」という謎の文言が現れました。 ⬇︎

説明

まず、上記二つのレポート、もう一箇所に細かい変更がありました。気付きましたか?
それは、左上の盾の色です。緑色から黄色になりました。

2019/10のデータを出した時⬇︎

2019/08〜2019/10のデータを出した時 (同じ条件) ⬇︎

気付きにくいところですね!
更に、マウスをその盾の上に移すを、説明が出ます。

2019/10のデータの場合:「このレポートは 100% のセッションに基づいて作成されています」⬇︎

2019/08〜2019/10のデータの場合:「このレポートは 70.53% のセッションに基づいて作成されています」⬇︎

また、下のボタンを押すと、「速度優先」と「精度優先」の選択が現れます。⬇︎

一体どういうことでしょうか。GAに問い合わせした結果、下記の参考ドキュメントを教えていただきました。リンク:データのサンプリングについて
要は、選択した期間でセッション数が一定件数を超えると、データのサンプリングが発生します。データのサンプリングが発生した時、「速度優先」か「精度優先」か選ぶことができますけれども、いずれにしても100%の精度に至りません
なので、先ほど2019/10のレポートは全てのデータが使われていましたが、2019/08〜2019/10の期間に設定すると、一部のデータしかサンプリングされていなくて、生憎ちょうど何も結果が出てませんでした(精度優先にしても)。
ここの怖いことは、データのサンプリングを知らないと、「データがないよ」、「UU数が少ないよ」、「訪問者がいなかったよ」というような誤った結論になるので、GAを使った時ちゃんと心掛けましょう。

GAの指標の個数によって、メジャーの数字が変わったりする?

事象

Google DataStudioから、GAに接続して表を出すとします。指標の個数が増えると、指標の数字も変わります。

例えば、日別で「timestamp数」の指標を出します。(timestamp数は、COUNT(timestamp)にしています)。 更に「user IDの平均長さ」の指標も出します。(user IDの平均長さは、AVG(LENGTH(ユーザーID))にしています)。

下記のキャプチャーと録画を参考してみてください。

  • 左の表ト:一つの指標を入れています。(timestamp数)
  • 右の表:二つの指標を入れています。(timestamp数、user IDの平均長さ)

右の表では、指標「user IDの平均長さ」が追加されています。ただし、指標「timestamp数」の数字が変わりました。左と右の「timestamp数」が異なっています。

説明

ここも先ほど述べた問題と同じく、データのサンプリングの問題が発生しています。指標が追加されてセッション数が閾値を超えたため、データのサンプリングが発生しています。従って、それぞれの集計の数字も違います。気を付けないと誤解が生じますね。特に、DataStudio側ではGA管理画面の盾のようなマークが付いていないので、いつからサンプリングされるか予想しかねます。

期間の長さによって、特定期間のメジャーの数字が変わったりする?

事象

GAデータの集計について、集計期間が長ければ長いほど数字も変わってしまいます。例えば、下記の表を出します。

  • ディメンション:「日付」
  • 指標:「TimeStamp数」、「UserIDの長さの平均」

また、二つ目の表を作ります。(ディメンションと指標が同じ、期間のみ異なります。下記のキャプチャーを参考に)

  • 左:2019/06/07〜2019/06/14 (7日間)
  • 右:2019/06/07〜2019/11/25 (約5ヶ月間)

よく見ればわかりますが、左の数字を右の数字は、同じ期間の部分は完全に違います。

実際の動きを見てみましょう。最初は、左も右も同じ七日間で数字が同じなんですけど、右の方の期間を伸ばすと、同じ期間の数字が一瞬で変わりました。

説明

ここも先ほどと同じ問題で、データのサンプリングが発生しています。
期間が長くなると、セッション数が増えていて、GA側が自動でデータのサンプリングを稼働させます。
また、Google Data Studioの場合、サンプリングが発生しているか分からないので、本当に気を付けないといけません。

新しく実装されたカスタムディメンションをレポートに含めると、データが出たり出てなかったりする?

事象

下記のレポートを、2019/11/06の分で出しました。

  • ディメンションは二つ:「日付」、「TimeStamp」
  • 指標は一つ:「平均セッション時間」
  • フィルターは何も入っていません。

こんな感じになります。、実装された「contract_type_session」カスタムディメンションをレポートに入れると、2019/11/06の分のレポートには、「このレポートのデータはありません。」という表示になっています。
謎ですね。2019/11/06のデータがあるのに、なぜ無いという表示でしょうか。⬇︎

実際の動きはこんな感じです。⬇︎
2019/11/06レポートにカスタムディメンションを入れると、「このレポートのデータはありません。」となります。

説明

実は、これはヌルの問題です。(ヌル=値が無い。何も入っていない。)
GA側の仕様で、ヌルがある場合「表示しない」とのことです。

今回新しく実装したカスタムディメンションは、2019-11-07から値が入り始めたので、その前は全てヌルです。
下記の感じです。⬇︎

日付Timestamp新実装カスタムディメンション平均セッション時間
201911 062019/11/06 00:00:11★(ヌル)00:08:05
201911 062019/11/06 00:00:16★(ヌル)00:03:02
201911 062019/11/06 00:00:30★(ヌル)00:10:45
201911 06…...…...…...
201911072019/11/07 14:14:16(値あり)02:32:06
201911072019/11/07 14:52:41(値あり)02:39:32
201911072019/11/07 15:04:05(値あり)02:43:38
20191107…...…...…...

ただし、ヌルが入っていると、表示しない仕組みなので、
GAにて上記のデータを出した時、あるカラムにヌルが入っている部分は自動的に全て非表示となりますので、
2019/11/06 のみの期間に設定すると、「このレポートのデータはありません。」となります。

つまり、2019/11/06 他のカラムに値が入っていても、一つのカラムにヌルが入っていれば、表示されません

なお、参考として、2019-11-06 新しく実装したカスタムディメンションとは別に、他のディメンションを入れても、データが問題なく表示できます

もう一つの参考ですが、新しく実装したカスタムディメンションは、予想通り 11/07 以後データがあります。⬇︎

まとめ

今回、Google Analytics の落とし穴を説明しました。
まとめて言うと、下記のことによりデータのサンプリングが発生します。

  1. レポートの指定期間:データが出なかったり、または集計の数字が変わったりする
  2. レポートに指標の個数:集計の数字が変わったりする

なお、新実装のカスタムディメンションは、未実装の期間を含めると、他のディメンションや指標を入れてもレポートが出せません

レポートを出した時、上記のところに気を付けないと違う結論になるので、心掛けましょう!

連絡先情報

Nếu bạn có thắc mắc gì, có thể gửi yêu cầu cho chúng tôi, và chúng tôi sẽ liên lạc lại với bạn sớm nhất có thể .

LPテック電子商取引有限会社

事業登録証0315561312号、計画投資省

Văn phòng: Lầu 6, Toà nhà Hoàng Minh, 100 Nguyễn xí, Phường 26, Quận Bình Thạnh, HCMC

Hotline: 0338 586 864

Mail: sales@lptech.asia

Zalo:LP Tech Zalo Official

携帯電話のカメラを開いて上のQR画像をスキャンし、QRコードをスキャンして、ZaloでLPTechに直接メッセージを送信できるようにします。 または、LPTechに連絡するには、サポートが必要な情報を下の連絡先ボックスに入力してください。

同じ記事カテゴリ

Google SEOトレンド2020

Google SEO Trends 2020私たちは、推測によるものではなく、データによるものです。 SEOの首謀者である私たちは、あなたが信じるSEOテストに1年でより多くのお金を費やしています。

SEOの歴史と検索エンジンの進化

人工的な外部リンクが隆盛を極め、とにかくリンクを多く貼ったもの勝ちという時代でしたが、この10年の間で検索エンジンも大きく進化してきました。SEOの歴史を語る上で決して欠かすことができないのが検索エンジンの進化についてです。

GoogleのSEOで必ず押さえておくべき3つのポイント

日本の実質的な検索シェアの9割以上をGoogle検索エンジンが占めている現状、GoogleでのSEOを成功させることがそのままSEOの成功に直結します。ここではGoogleのSEOの基本的なポイントを大まかな視点から初心者向けに解説しています。

カテゴリー


最新の投稿


<日本のことわざ> -笑う門には福来たる

さて、古代ギリシャの哲学者アリストテレスは「笑う 者は人間だけである」と言ったそうですが、実は人間だ けではなく、「笑い」はチンパンジーやゴリラなどの霊 長類にもあり、これは「あなたに敵意はありません」と いうように、攻撃してくる相手に対する意志伝達やコミ ュニケーションに使われます。

新型コロナウイルス感染症(covid-19)診療の手引き

新型コロナウイルス感染症は人から人へと感染して、発症します。感染した人が咳やくしゃみをしたり、他の人に近づいてしゃべったりすることが、感染の主な原因になっています。

Google Analytics の落とし穴

Google Analytics (以下:GA)を使っていて、期間が定まっていても、集計された指標や数字が変動したり、データがなくなったりという事象が起こっています。 検証など行いましたが、やはり不明な部分が残っていたので、直接GAのサポートに問い合わせしました。

明けましておめでとう2020

LPTechは旧正月の休日を発表します。LPTechは、顧客とパートナーに将来価値と利益をもたらすために、懸命に働き、顧客の意見を聞き、理解しようとします。

Google SEOトレンド2020

Google SEO Trends 2020私たちは、推測によるものではなく、データによるものです。 SEOの首謀者である私たちは、あなたが信じるSEOテストに1年でより多くのお金を費やしています。

SEOの歴史と検索エンジンの進化

人工的な外部リンクが隆盛を極め、とにかくリンクを多く貼ったもの勝ちという時代でしたが、この10年の間で検索エンジンも大きく進化してきました。SEOの歴史を語る上で決して欠かすことができないのが検索エンジンの進化についてです。

GoogleのSEOで必ず押さえておくべき3つのポイント

日本の実質的な検索シェアの9割以上をGoogle検索エンジンが占めている現状、GoogleでのSEOを成功させることがそのままSEOの成功に直結します。ここではGoogleのSEOの基本的なポイントを大まかな視点から初心者向けに解説しています。